مجله علوم پزشکی زانکو/ دانشگاه علوم پزشکی کردستان/ زمستان 9-29 934/ مقاله پژوهشی مقایسه برآورد نسبت شانس حاصل از دو مدل رگرسیون لجستیک و رگرسیون لجستیک شرطی در مطالعه مورد- شاهدی تعیین عوامل خطر مسمومیتهای غیر عمد کودکان در تهران )Original paper( Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 4 3 *2 کاميار منصوري شيوا منصوري هانيس حميد سوري فاطمه خسروي شادمانی فرهاد مرادپور 4 4 عبدالحليم رجبی علی غالمی - گروه اپیدمیولوژی دانشکده بهداشت دانشگاه علوم پزشکی شهیدبهشتی تهران ایران. 2- کمیته تحقیقات دانشجویی دانشگاه علوم پزشکی کردستان سنندج ایران )مولف مسول( ایمیل: mansorishiva@gmail.com 3- گروه اپیدمیولوژی دانشکده بهداشت دانشگاه علوم پزشکی کرمانشاه کرمانشاه ایران. - 4 گروه اپیدمیولوژی دانشکده بهداشت دانشگاه علوم پزشکی ایران تهران ایران. چکيده زمينه و هدف: شناخت عوامل خطر موثر در بروز مسمومیت یک اقدام اساسی برای پیشگیری از مسمومیت در هر جامعهای است در این میان یافتن معادلهای برای تعیین اثر این عوامل و شدت ارتباط آنها با ابتال به مسمومیت دارای اهمیت فراوانی است هدف مطالعه حاضر مقایسه عملکرد دو مدل رگرسیون لجستیک معمولی و رگرسیون لجستیک شرطی در تعیین عوامل خطر موثر بر ایتال به مسمومیتهای غیر عمد کودکان است. روش بررسی: در مطالعه حاضر از دادههای یک مطالعه مطالعه مورد- شاهدی که در سال 332 با هدف تعیین عوامل خطر مسمومیتهای خطر عمد کودکان در تهران انجام گرفته بود استفاده شد. دادههای مربوطه پس از جمعآوری در نرم افزار stata وارد و برای تعیین عوامل خطر موثر بر ایتال به مسمومیت از دو مدل رگرسیون لجستیک شرطی Regression( )Conditional Logistic و رگرسیون لجستیک معمولی Regression( )Logistic استفاده شد. سپس نسبت شانس )OR( با فاصله اطمینان (CI) %39 بصورت خام و تعدیل شده همراه با حساسیت ویژگی و سطح زیر منحنی راک برای هر کدام از دو مدل فوق برآورد گردید سپس به مقایسه آنها پرداخته شد. یافتهها: در مدل چندگانه رگرسیون لجستیک شرطی اشتغال مادر مسمومیت قبلی اعتیاد در خانواده و دور از دسترس بودن مواد مسمومیت زا بر ابتال به مسمومیت تاثیر قابل توجهی نشان دارد اما در مدل چندگانه رگرسیون لجستیک معمولی عالوه بر موارد ذکر شده بیماری روحی/روانی در خانواده نیز رابطه معنیداری را با پیامد )مسمومیت( نشان داد. مقدار سطح زیر منحنی ROC برای مدل رگرسیون لجستیک شرطی ( 0/39-0/34 CI: %39( %39/22 با حساست % 23/99 با 32/3 درصد و ویژگی 24/2 درصد و برای مدل رگرسیون لجستیک معمولی )0/33- CI:0/28 %39( حساسیت 23/8 درصد و ویژگی 23/ درصد بدست آمد. نتيجهگيري: اگرچه فاصله اطمینانهای مربوط به مدل رگرسیون لجستیک شرطی در مقایسه با رگرسیون لجستیک معمولی دامنه کمتری را در بر میگیرد و از سویی دیگر باالتر بودن سطح زیر منحنی ROC نشان دهنده خوب بودن دقت کلی این مدل در تشخیص مسمومیت است. اما باید توجه داشت استفاده از هرکدام از این مدلها به خصوصیات دادههای مورد بررسی )همسان شده و نشده( وابسته است. واژههايکليدي: مسمومسیت در کودکان رگرسیون لجستیک شرطی رگرسیون لجستیک معمولی مورد شاهدی
شیوا منصوری هانیس 99 Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 مقدمه مسمومیت یکی از مشکالت اساسی بهداشت عمومی است و هنوز یکی از علل مهم پذیرش در بخشهای اورژانس به حساب میآید )(. بطورکلی مسمومیت حاد عامل مرگ ساالنه حدود 49000 نفر از کودکان و نوجوانان زیر 20 سال است. میزان جهانی مرگ ناشی از مسمومیت برای کودکان زیر 20 سال /2 در صد هزار نفر است که برای کشورهای با درآمد باال این میزان 0/9 در صد هزار نفر است در حالی که برای کشورهای با درآمد کم و متوسط 4 برابر بیشتر است )2 در صدهزار( )2(. گرچه بسیاری از این مسمومیتها توسط کادر پزشکی- درمانی کنترل شده و به مرگ منتهی نمیشود ولیکن خسارات جبران ناپذیری را به پیکره اقتصاد سالمت و بهداشت جسمی و روانی جامعه و خانواده وارد خواهد نمود و نیز بار عاطفی و اضطراب خانوادگی ناشی از آن نیز سنگین بوده و باید هنگام ارزیابی ابعاد این مساله مورد توجه قرار گیرد )3(. بنابراین شناخت عوامل خطر موثر در بروز مسمومیت یک اقدام اساسی برای برنامههای پیشگیری از مسمومیت در هر جامعهای است چرا که کاهش دادن این عوامل خطر باعث کاهش نرخ بروز مسمومیت خواهد شد در این میان یافتن معادلهای برای تعیین اثر عوامل خطر و شدت ارتباط آنها با ابتال به مسمومیت دارای اهمیت فراوانی است )4(. مطالعات مورد شاهدی یکی از متداولترین طرحهای مطالعاتی در اپیدمیولوژی تحلیلی است که برای چنین مواقعی بکار برده میشود )9(. هدف چنین مطالعهای بررسی عوامل بالقوه موثر در ایجاد بیماری است. در این نوع مطالعه مشاهدهای برای تعیین ارتباط یک مواجهه )عامل بیماری( و یک بیماری خاص یک گروه از افراد مبتال به آن بیماری )مورد( را در نظر گرفته و یک گروه از افرادی که به آن بیماری مبتال نیستند )شاهد( را با آنها مقایسه میکنند )8(. بطور کلی در مطالعات اپیدمیولوژیک تعیین تأثیر یک مواجهه بر خطر ابتال به بیماری معموال توسط خطر نسبی Risk( )Relative بیان میگردد در )9(. مطالعات مورد شاهدی هم نسبت شانس ( Ratio Odds ) یک اندازه خطر است که نشان دهنده آن است که چقدر شانس کسی که با یک عامل خطر مواجهه داشته از کسی که مواجهه نداشته بیشتر است. نسبت شانس Ratio( )Odds برای متغیر پاسخ هم از طریق جداول توافقی هم روش مدلسازی قابل محاسبه است. در این مقاله روش مدلسازی مد نظر است )8 و 2 (. از بین کل متغیرهای این مطالعه متغیر پاسخ مسمومیت در نظر گرفته شده و با مدلسازی هدف تعیین میزان تأثیر سایر متغیرها بر مسمومیت بود. در مطالعه حاضر به مقایسه برآورد نسبت شانس Ratio( )Odds حساسیت ویژگی و سطح زیر منحنی ROC دو مدل رگرسیون لجستیک و رگرسیون لجستیک شرطی توسط دادههای حاصل از یک مطالعه مورد- شاهدی که با هدف تعیین عوامل خطر مسمومیتهای غیرعمد کودکان در تهران انجام گرفته بود )( پرداخته خواهد شد. الزم به ذکر است که مدل رگرسیون لجستیک شرطی همانند مدل لجستیک معمولی است. تنها تفاوت این دو روش این است که رگرسیون لجستیک شرطی برای دادههای همسان شده فردی به کار میرود. به عبارتی دیگر هنگامی که در یک مطالعه مورد-شاهدی هریک از افراد گروه شاهد با نظیر خود در گروه مورد از نظر یک یا چند متغیر همسان شده باشد باید برای تجزیه و تحلیل آماری از رگرسیون لجستیک شرطی استفاده شود.
92 مقایسه برآورد نسبت شانس... Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 روش بررسی در این مطالعه برای پیشبینی مسمومیت در کودکان مدل رگرسیون لجستیک و رگرسیون لجستیک شرطی اعمال شد و همچنین شاخصهایی مانند حساسیت و ویژگی و سطح زیر منحنی ROC برای سنجش میزان قدرت و دقت مدل محاسبه گردید. در این قسمت هر کدام از این مدلها به اختصار توضیح داده می شوند. مدل رگرسیون لجستیک: تشخیص الگوها و طبقهبندی یکی از مهمترین کاربردهای روشهای آماری در علوم مختلف است. از جمله اهداف عمده مدل سازی در علوم آمار پیشبینی بر اساس شواهد متغیرها و دادههای موجود از یک موضوع خاص است. این امر در علوم آماری توسط روشهایی مانند رگرسیون تحلیل ممیزی )جداسازی( سریهای زمانی ردهبندی رگرسیون درختی و سایر روشها انجام میشود. در نظر گرفتن یک توزیع پیش فرض مانند توزیع نرمال برای متغیرهای پاسخ خطی بودن رابطه پیشنهادی یکسان بودن واریانس خطاها... از جمله محدودیتهای بعضی روشهای کالسیک هستند که هنگام استفاده علمی از این روشها اگر داده- های واقعی شرایط مفروض مدل را نداشته باشند امکانپذیر نبوده یا با خطای قابل توجه همراه است )3(. در بین این روشها رگرسیون لجستیک فرضیات زیادی را الزم ندارد و از جمله روشهای آماری چند متغیرهای است که میتواند برای ارزیابی ارتباط بین متغیرهای مستقل هر چند مخدوش کننده و متغیر وابسته )پیشامد طبقهای( و پیشبینی ابتال به بیماری بر اساس متغیرهای پیشگو در مدل مورد استفاده قرار میگیرد )0(. رگرسیون لجستیک زمانی مورد استفاده قرار میگیرد که متغیر وابسته به صورت دوتایی اسمی یا ترتیبی باشد و برای متغیرهای مستقل هیچ محدودیتی وجود ندارد. در علوم پزشکی متغیر پیشامد به طور معمول حضور یا عدم آن از یک وضعیت بیان شده یا یک بیماری میباشد. مفهوم اصلی ریاضی که پایه و اساس رگرسیون لجستیک است لجیت یعنی لگاریتم طبیعی نسبت شانس Ratio(.)Odds رگرسیون لجستیک بر اساس یک فرضیه که شامل یک ارتباط لجستیکی موجود بین احتمال عضویت گروه و یک یا چند متغیر پیشبینیکننده میباشد بنا نهاده شده است ),, 2(. از آنجایی که احتمال پیشبینی شده باید بین اعداد صفر و یک قرار گیرد تکنیکهای رگرسیون خطی برای دستیابی به آن کفایت نمیکند به این دلیل که آنها به متغیرهای وابسته اجازه داده اند که از محدودیت ها گذشته نتایج ناسازگار تولید کنند. با تعریف به عنوان احتمال تعلق یک مشاهده به گروه غیر بیمار و احتمال تعلق یک مشاهده به گروه بیمار مدل رگرسیون لجستیک بصورت زیر است: نسبت شانس نامگذاری شده است. مقدار j امین ضریب را که =j K., و مقدار i امین مشاهده از j امین متغیر پیشبینیکننده است. پارامترهای تا از مدل لجستیک با استفاده از روش ماکزیمم درستنمایی برآورد میشوند. در معادله ذکر شده تبدیل لجیت جهت مرتبط ساختن احتماالت عضویت گروه به یک تابع خطی از متغیرهای پیش- بینیکننده مورد استفاده قرار می گیرد. )2-0(. مقادیر و احتمال اختصاص مشاهده به گروههای کنترل و مسموم بود و در نهایت جهت ساختن آماره Z تحت الگاریتم طبیعی توسط نرم افزار بدست میآید. از مزایای استفاده ازمدل رگرسیون مجله علوم پزشکی زانکو/ دانشگاه علوم پزشکی کردستان/ زمستان 9-29 934/
شیوا منصوری هانیس 93 Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 بجای مدل رگرسیون لجستیک استاندارد با حذف پارامتر طبقات )پارامترهای مزاحم( برآورد نااریبی از پارامترهای مهم که ارتباط عوامل خطر و پاسخ را نشان میدهد خواهیم داشت. شکل کلی تابع لجستیک شرطی برای مطالعات مورد شاهدی همسانسازی فردی بصورت زیر است: = تعداد موردها بردار پارامترها (vector of (vector بردار متغیرهای مستقل X و parameters) covariates) ofمیباشد و k نیز تعداد مجموعههای همسانسازی شده sets) (numbers of match یا همان strata است,4(.)9 دادهها: در مطالعه حاضر از داده های یک مطالعه مطالعه مورد- شاهدی که در سال 332 با هدف تعیین عوامل خطر مسمومیت های خطر عمد کودکان در تهران انجام گرفته بود استفاده شد. که در آن مطالعه موردها از میان کودکان با تشخیص مسمومیتهای غیرعمد که بطور متوالی از تاریخ بیستم اسفند 33 تا بیست و پنجم تیر 332 به بخش مسمومیت اطفال بیمارستان لقمان تهران مراجعه کرده بودند انتخاب شده بودند. سپس به ازای هر مورد 2 شاهد از میان کودکانی که به دالیل دیگری غیر مسمومیت از قبیل تنفسی جراحی و گوارشی به سایر بخشهای این بیمارستان مراجعه کرده بودند انتخاب شده بودند. بیماریهای نورولوژیک بیماریهای متابولیک عفونتهای مغزی و تروماهای مغزی به عنوان معیارهای خروج برای شاهدها در نظر گرفته شده شدند. سپس همسان سازی فردی صورت گرفته بود و شاهدها از لحاظ سن )±8 لجستیک عالوه بر مدلسازی مشاهدهها امکان پیشبینی احتمال تعلق هر فرد به هر یک از سطوح متغیر وابسته و همچنین امکان محاسبه مستقیم نسبت شانس ( Odds )Ratio با استفاده از ضرایب مدل است )3(. مدل رگرسیون لجستیک شرطی: همسانسازی )matching( یکی از روشهای کنترل اثر متغیرهای مخدوشکننده در طراحی مطالعه به شمار میآید. معموال در مطالعات مورد شاهدی برای اطمینان از قابلیت مقایسه کیس و کنترلها از همسان سازی )matching( استفاده میشود. در این فرایند گروه شاهد بنحوی انتخاب میشود که از نظر برخی متغیرها مشابه گروه مورد باشد. همسان سازی معموال با دو هدف صورت صورت گیرد یکی افزایش دقت مطالعه (precision) و دیگری کنترل اثر متغیر یا متغیرهای مخدوشکنندهای) Variables (confounding که به آسانی نمیتوان آنها را تعیین کرد. همسان سازی به دو صورت امکانپذیر است که شامل همسانسازی فردی matching( )individual و همسانسازی گروهی matching( )frequency میباشد )3(. هنگامی که در مطالعات مورد شاهدی همسانسازی فردی matching( )individual صورت گیرد یعنی به ازای هر فرد گروه مورد یک یا چند فرد از گروه شاهد که از نظر متغیر)های( مخدوشکننده مشابه باشد انتخاب شود از رگرسیون لجستیک شرطی (conditional regression) logistic استفاده میشود. چرا که در این موارد که با تعداد زیادی از طبقات و به تبع آن با حجم نمونه کم در طبقات روبه رو هستیم و با افزایش حجم نمونه تعداد پارامترها زیاد میشود برآورد حاصل از برازش مدل رگرسیون لجستیک استاندارد دارای اریبی خواهد بود. از طرفی برآورد پارامتر مربوط به طبقات در مطالعات همسان سازی شده اهمیت چندانی ندارد لذا با بکارگیری مدل رگرسیون لجستیک شرطی
94 مقایسه برآورد نسبت شانس... Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 ماه( و جنس با موردها همسان شده بودند. به منظور جمعآوری اطالعات همه والدین کودکان توسط محقق از طریق یک پرسشنامه که شامل خصوصیات جمعیت شناختی رفتاری و عوامل خطر مسمومیتهای غیرعمد از جمله اشتغال مادر تحصیالت والدین سیگاری بودن والدین مسمومیت قبلی اعتیاد در خانواده بیماری روحی/روانی در خانواده دور از دسترس بودن مواد مسمومیتزا و بعد خانوار بود مورد مصاحبه قرار گرفتنه بودند. برای موردها اطالعاتی درباره نوع وشرایط مسمومیت نیز جمعآوری شده بود.)4( دادههای مربوطه پس از جمعآوری در نرم افزار stata وارد سپس تعیین عوامل خطر به دو روش صورت گرفت: در روش اول از آنالیزهای تک متغیره و چند متغیره رگرسیون لجستیک شرطی Regression( )Conditional Logistic با فرض همسان سازی فردی و در روش دوم نیز از آنالیزهای تک متغیره و چند متغیره رگرسیون لجستیک معمولی Regression( )Logistic با فرض عدم همسانسازی فردی استفاده شد. در نهایت نسبت شانس )OR( با فاصله اطمینان (CI) %39 بصورت خام و تعدیل شده همراه با حساسیت ویژگی و سطح زیر منحنی راک برای هر کدام از دو مدل فوق برآورد گردید سپس به مقایسه آنها پرداخته شد. الزم به ذکر است که در این مطالعه درست است که در ابتدا دادهها از نظر سن و جنس همسان سازی شده بودند اما خود نرم افزار stata میتواند دادههای همسان سازی شده را ناهمسان فرض نماید و نسبت شانس )OR( را برای این حالت )unmatch) نیز برآورد نماید. یافتهها در مطالعهای که ذکر شد 40 کودک مسموم با 220 کنترل مورد بررسی قرار گرفته بودند. جدول توزیع خصوصیات مربوط به خانواده 40 کودک مسموم مراجعهکننده به بیمارستان لقمان حکیم تهران و 220 شاهد را که از لحاظ سن ) 8 ±ماه( و جنس همسان سازی شده بودند را نشان میدهد. در ابتدا به منظور شناسایی مهمترین عوامل تاثیرگذار بر مسمومیت به ترتیب اقدام به آنالیز تک متغیره رگرسیون لجستیک شرطی و رگرسیون لجستیک گردید و برای اینکه هیچ متغیر مهمی نادیده گرفته نشود در ابتد سطح معنیداری 0/=α در نظر گرفته شد. نتایج این هر دو این آنالیزها نشان داد که اشتغال مادر تحصیالت پدر تحصیالت مادر سیگاری بودن پدر سیگاری بودن مادر مسمومیت قبلی اعتیاد در خانواده بیماری روحی/روانی در خانواده دور از دسترس بودن مواد مسمومیت زا و بعد خانوار بر ابتال به مسمومیت تاثیر قابل توجهی دارد )0/>P(. )جدول (. سپس به منظور بررسی اثر همزمان متغیرها و حذف متغیرهای احتمالی مخدوشکننده متغیرهای با سطح معنیداری کمتر از 0/ در هر کدام از مدل های فوق بطور همزمان به ترتیب در مدل چندگانه رگرسیون لجستیک شرطی و رگرسیون لجستیک وارد کردیم و با استفاده از روش گام به گام پسرو (backward Stepwise) به حذف مخدوش کنندها و تعدیل یافته- های معنیدار پرداخته شد. نتایج حاصل از آنالیز مدل چندگانه رگرسیون لجستیک شرطی نشان داد که اشتغال مادر مسمومیت قبلی اعتیاد در خانواده و دور از دسترس بودن مواد مسمومیتزا بر ابتال به مسمومیت تاثیر قابل توجهی دارد )0/09>P( )جدول 2(. اما نتایج حاصل از مدل چندگانه رگرسیون لجستیک نشان داد مجله علوم پزشکی زانکو/ دانشگاه علوم پزشکی کردستان/ زمستان 9-29 934/
شیوا منصوری هانیس 9 Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 که عالوه بر موارد اثرگذار بدست آمده از مدل چندگانه رگرسیون لجستیک شرطی که با ابتال به مسمومیت رابطه معنیداری داشتند بیماری روحی/روانی در خانواده کودک نیز رابطه معنیداری را با پیامد )مسمومیت( نشان داد )0/00>P( )جدول.)3 از تحلیل ROC به عنوان مقیاس اندازهگیری توانایی جداسازی یک مدل با بیشترین ناحیه که نشان- دهنده توانایی پیشبینی بهتر است برای مقایسه انجام مدلها بکار میرود استفاده میشود. الزم به ذکر است سن )سال( که دقت باالی خوب بین درصد عالی بین 30 20-30 90-20 درصد قابل قبول بین درصد 80-90 درصد ضعیف و چنانچه دقت آزمونی زیر 80 درصد گردد غیر قابل قبول میباشد. در این مطالعه مقدار سطح زیر منحنی ROC برای مدل رگرسیون لجستیک %39/22 با )%39 CI: شرطی )0/34-0/39 حساست 32/3 درصد و ویژگی 24/2 درصد )شکل ( و برای مدل رگرسیون لجستیک CI:0/28-0/33( )%39 %23/99 با حساست 23/8 درصد و ویژگی 23/ درصد بدست آمد )شکل 2(. جدول : عوامل موثر بر ابتال مسموميت با استفاده از دو مدل تک متغيره لجستيک شرطی و لجستيک معمولی مدل رگرسیون لجستیک معمولی مدل رگرسیون لجستیک شرطی )فاصله اطمينان P-value )فاصله اطمينان OR)%59 OR)%59 - - - شاهدها )%( موردها )%( P-value متغير - 8)/4( 24)80( 40 )22/8( - - - - 20 )99/( 80 )42/3( 40)4/3( 84)92/8( 98)292/( 80 )99/( 20 )42/3( 2-4 <9 جنس پسر دختر اشتغال مادر خانه دار سایر تحصيالت مادر دانشگاهی غيردانشگاهی تحصيالت پدر دانشگاهی غيردانشگاهی سيگاري بودن پدر خير بله 2/2 )4/9- /( )0/2-0/32( 0/28 )0/22-0/32( 0/29 0/03 )/ - 4/88( 2/22 > 0/00 >0/00 9/3 )4/4-2/2( >0/ 00 0/29 )0/22-0/32( 0/29 )0/22-0/3( 9/49 )4/9- /9( 0 /024 23)23/9( 9)2/3( > 0/00 3 )3/3( 29 )30/9( > 0/00 8 )/4( 24 )22/8( > 0/00 43 )30/9( 39 )83/3( 284 )34/3( 8 )9/9( 43 )9/9( 23 )22/9( 83 )24/9( 2 )99/3( 29 )98/2( 89 )23/2(
9 مقایسه برآورد نسبت شانس... Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 2 )0/23-9/( 0/08 2/2 )0/3-94/( 0 /08 38 )39/( 4 )2/3( - - - - 39 )38/4( 8/9 )3/3-2/2( )2/9-34/8( 9/4 4/9 )2/4-3/( )0/0-0 /03( 0/03 /98 )/4-2/3( > 0/00 8/2 )3/3 - ( > 0/00 )/4-39/2( 20/ > 0/00 4/2 )2/9-3/3( > 0/00 0/43 )0/02-0/22( > 0/00 /82 )/3-2/04( 9 )3/8( > 0/00 33 )90/9( 4 )23/3( > 0/00 93 )39/3( 29 )82/( > 0/00 0 )92/8( 30 )2/4( > 0/00 99 )93/8( 89 )48/4( > 0/00 42 )30( 32 )90( 293 )33/8( )0/4( 220 )00( 0 282 )33/8( 2 )8/4( 299 )3/2( 23 )2/2( 289 )34/8( 9 )9/4( 290 )38/4( 0 )3/8( 22 )49/9( 92 )94/3( سيگاري بودن مادر خير بله وضعيت سرپرستی کودک با هردو والد سایر مسموميت قبلی خير بله اعتياد در خانواده خير بله بيماري روحی- روانی در خانواده خير بله دور از دسترس بودن محصوالت مسموميت زا بله خير بعد خانوار)تعداد( )فاصله اطمینان OR )%39 )فاصله اطمینان P-value OR )%39 شاهدها )%( موردها )%( P-value >4 4 جدول 2 : عوامل موثر بر ابتال به مسموميت با استفاده از مدل چندگانه رگرسيون لجستيک شرطی فاصله اطمینان % 39 OR P-value متغیرها 0 /03 4 /3 2/ 3 اشتغال مادر > 0/00 9 2 /4 20/ 2 مسمومیت قبلی > 0/00 4 / 8 8 /2-34/ 8 اعتیاد در خانواده > 0/00 0 / 03 0 /0 0/ 2 دور از دسترس بودن محصوالت مسمومیت زا مجله علوم پزشکی زانکو/ دانشگاه علوم پزشکی کردستان/ زمستان 9-29 934/
شیوا منصوری هانیس 9 Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 جدول 2 :عوامل موثر بر ابتال به مسموميت با استفاده از مدل چندگانه رگرسيون لجستيک معمولی فاصله اطمینان % 39 OR P-value متغیرها 0 /03 9 / 2 2 /3 4/ 2 اشتغال مادر > 0/00 9 / 3 2 /9 3/ 2 مسمومیت قبلی > 0/00 9 / 9 2 /3-34/ 2 اعتیاد در خانواده > 0/00 0 / 09 0 /02 0/ 2 دور از دسترس بودن محصوالت مسمومیت زا 0 /0 3 / 9 /3 3/ بیماری روحی _ روانی در خانواده شکل : سطح زیر منحنی راک حساسيت و ویژگی حاصل از مدل چندگانه رگرسيون لجستيک شرطی
9 مقایسه برآورد نسبت شانس... شکل 2 : سطح زیر منحنی راک حساسيت و ویژگی حاصل از مدل چندگانه رگرسيون معمولی Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 بحث و نتيجهگيري با توجه به اهمیت بیماری مسمومیت در کودکان و باال بودن درصد ابتال به آن در جوامع مختلف امر پیش بینی این بیماری حائز اهمیت میباشد و در این راستا انتخاب مدل آماری مناسبی که بتواند مشاهدات را به درستی برای داشتن بیماری پیشبینی کند و یا اینکه آیا کودک در آینده شانس ابتال به مسمومیت را دارد دارای اهمیت زیادی است. نتایج آنالیز تک متغیره هر دو مدل رگرسیون لجستیک شرطی و رگرسیون لجستیک نشان داد که اشتغال مادر تحصیالت پدر تحصیالت مادر سیگاری بودن پدر سیگاری بودن مادر مسمومیت قبلی اعتیاد در خانواده بیماری روحی/روانی در خانواده دور از دسترس بودن مواد مسمومیتزا و بعد خانوار بر ابتال به مسمومیت تاثیر قابل توجهی دارد )0/>P(. نتایج حاصل از آنالیز مدل چندگانه رگرسیون لجستیک شرطی نیز نشان داد که 4 مواجهه اشتغال مادر مسمومیت قبلی اعتیاد در خانواده و دور از دسترس بودن مواد مسمومیتزا بر ابتال به مسمومیت تاثیر قابل توجهی دارد )0/00>P(. اما نتایج حاصل از مدل چندگانه رگرسیون لجستیک نشان داد که عالوه بر 4 مواجهه حاصل از مدل چندگانه رگرسیون لجستیک شرطی بیماری روحی/روانی در خانواده کودک نیز رابطه معنیداری را با ابتال به مسمومیت دارد )0/00>P(. نکته قابل توجه این است که نسبت شانسهای برآوردشده هم در حالت تک متغیره و هم چند متغیره برای هر کدام از مواجههها توسط مدل رگرسیون لجستیک شرطی در مقایسه با مدل رگرسیون لجستیک معمولی کوچکتر بوده و فاصله اطمینان های مربوط به آن دامنه کمتری را در بر می- گیرد و به عبارت دیگر دقت برآورد نسبت شانس در مجله علوم پزشکی زانکو/ دانشگاه علوم پزشکی کردستان/ زمستان 9-29 934/
شیوا منصوری هانیس 9 Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 این مدل بیشتر از مدل لجستیک معمولی است. علت آن را میتوان اینگونه توجیه کرد که در یک مطالعه مورد-شاهدی همسانسازی شده توزیع متغیرهای مخدوشکنندهای که همسانسازی بر مبنای آنها صورت گرفته در گروههای مورد و شاهد مشابه است و در نتیجه در همه طبقات ایجاد شده تعداد موردها و شاهدها تقریبا مشابه است و به ویژه طبقهای نخواهد بود که تنها مورد یا شاهد در آن باشد و در گروه مقابل فردی برای مقایسه وجود نداشته باشد که این تعادل میتواند باعث کاهش واریانس در پارامترهای مورد بررسی و به دنبال آن نیز افزایش efficiency آماری statistical( )efficiency و در نهایت افزایش دقت مطالعه نسبت به حالتی که مطالعه همسانسازی نشده خواهد شد ) 8 و 9 (. در مطالعه حاضر حساسیت و ویژگی حاصل از مدل لجستیک شرطی )حساست %32/3 ویژگی %24/2( باالتر از مدل رگرسیون لجستیک )حساسیت %23/8 ویژگی %23/( بود که میتوان گفت این مدل پیش- بینی مناسبتری از مشاهداتی که به گروههای مربوطه تخصیص داده شدهاند را اعمال کرده است. در واقع درصد کودکان مبتال به مسمومیت که توسط این مدل به درستی تشخیص داده شدهاند %32/3 و نیز درصد کودکان غیر مسموم که توسط این مدل به درستی پیشبینی شدهاند %24/2 بوده است. همچنین مقدار سطح زیر منحنی ROC برای مدل رگرسیون لجستیک شرطی با %39/22 بیشتر از سطح زیر این منحنی برای مدل رگرسیون لجستیک )%23/99( بود که با نتایج مطالعه Rahman و همکاران که به مقایسه سطح زیر منحنی ROC در دو مدل رگرسیون لجستیک و رگرسییون لجستیک شرطی پرداخته بودند همخوانی دارد )8(. در واقع باالتر بودن سطح زیر منحنی ROC نشانگر مناسبتر بودن مدل رگرسیون لجستیک شرطی است چرا که توانایی پیشبینی بهتری را دارد. با تمام این اوصاف با قاطعیت نمیتوان مدل مشخصی را به عنوان مناسبترین مدل معرفی کرد اما توصیه شده است اوال در تصمیمگیری در مورد استفاده از مدل رگرسیون لجستیک شرطی و مدل رگرسیون لجستیک باید به تعداد پارامترها )parameters( نبست به تعداد افراد (subjects) در مدل توجه کرد. مدل رگرسیون لجستیک زمانی که تعداد پارامترها نسبت به تعداد افراد کوچک باشد ترجیح داده میشود. ثانیا زمانی که همسانسازی فردی صورت گرفته باشد باید مدل رگرسیون لجستیک شرطی استفاده شود و اگر بصورت گروهی همسان سازی صورت گرفته یا اصال همسانسازی صورت نگرفته از مدل رگرسیون لجستیک استفاده شود. )2( چرا که در مواردی که همسانسازی فردی وجود دارد با تعداد زیادی از طبقات و به تبع آن با حجم نمونه کم در طبقات روبه رو هستیم و با افزایش حجم نمونه تعداد پارامترها زیاد میشود برآورد حاصل از برازش مدل رگرسیون لجستیک استاندارد دارای اریبی خواهد بود. از طرفی برآورد پارامتر مربوط به طبقات در مطالعات همسان- سازی شده اهمیت چندانی ندارد لذا با بکارگیری مدل رگرسیون لجستیک شرطی بجای مدل رگرسیون لجستیک استاندارد با حذف پارامتر طبقات )پارامترهای مزاحم( برآورد نااریبی از پارامترهای مهم که ارتباط عوامل خطر و پاسخ را نشان میدهد خواهیم داشت )4, 9(. نتیجه نهایی اینکه اگرچه در مطالعه حاضر مدل رگرسیون لجستیک شرطی برازش شده با توجه به مالکهای دقت و قدرت آن از جمله حساسیت و ویژگی نسبت به لجستیک معمولی مدل مناسبتری برای پیشبینی پیامد است اما باید توجه داشت استفاده از هرکدام از رویکردهای رگرسیون لجستیک شرطی
2 مقایسه برآورد نسبت شانس... یا لجستیک معمولی به خصوصیات دادههای مورد بررسی وابسته است. اگر همسانسازی فردی صورت گرفته باشد باید از لجستیک شرطی استفاده نمود چرا که اگر از رویکر رگرسیون لجستیک معمولی بجای آن استفاده شود نسبت شانس )OR( برآورد شده بزرگنمایی )overestimate( میشود,8(.)9 Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 References - Antonogeorgos G, Panagiotakos DB, Priftis KN, Tzonou A. Logistic regression and linear discriminant analyses in evaluating factors associated with asthma prevalence among 0-to 2-years-old children: Divergence and similarity of the two statistical methods. International journal of pediatrics. 2009;2009. 2- Fernando R, Fernando DN. Childhood poisoning in Sri Lanka. The Indian Journal of Pediatrics. 997;64(4):457-60. 3- Rice DP, MacKenzie EJ, Jones A, Kaufman S, DeLissovoy G, Max W, et al. Cost of injury in the United States: a report to Congress. 989. 4- Mansori M, Soori H, Farnaghi f, Sohaila K. Assessment Risk factors for unintentional childhood poisoning :a case-control study in Tehran. Journal of Safety Promotion and Injury Prevention. 203;(4):83-9 5- Aviva P, Sabin C. Medical statistics at a glance. Blackwell Science Ltd., Padstow, UK; 2000. 6- Langholz B, Goldstein L. Conditional logistic analysis of case-control studies with complex sampling. Biostatistics. 200;2():63-84. 7- Breslow NE,Day NE. Statistical methods in cancer research: International Agency for Research on Cancer Lyon; 987. 8- Hanley JA, Miettinen OS. An Unconditional like Structure for the Conditional Estimator of Odds Ratio from 2 2 Tables. Biometrical journal. 2006;48():23-34 9- Sedehi M, Mehrabi YE, Kazemnejad A, Hadaegh F. Comparison of artificial neural network, logistic regression and discriminant analysis methods in prediction of metabolic syndrome. 2009;(6):638-46. 0- Long JD, Loeber R, Farrington DP. Marginal and random intercepts models for longitudinal binary data with examples from criminology. Multivariate behavioral research. 2009;44():28-58. - Peng C-YJ, Lee KL, Ingersoll GM. An introduction to logistic regression analysis and reporting. The Journal of Educational Research. 2002;96():3-4. 2- Worth AP, Cronin MT. The use of discriminant analysis, logistic regression and classification tree analysis in the development of classification models for human health effects. Journal of Molecular Structure: Theochem. 2003;622():97-. 3- Bagley SC, White H, Golomb BA. Logistic regression in the medical literature:: Standards for use and reporting, with particular attention to one medical domain. Journal of clinical epidemiology. 200;54(0):979-85. 4- Kleinbaum DG, Klein M. Analysis of Matched Data Using Logistic Regression: Springer; 200. 5- McFadden D. Conditional logit analysis of qualitative choice behavior. 973. 6- Rahman M, Fukui T. Conditional versus unconditional logistic regression in the medical literature. Journal of clinical epidemiology. 2003;56():0-2. 7- Campos-Filho N, Franco EL. A microcomputer program for multiple logistic regression by unconditional and conditional maximum likelihood methods. American Journal of Epidemiology. 989;29(2):439-44 8- Fritz W. Statistical Methods in Cancer Research. Vol. The Analysis of Case Control Studies. Herausgegeben von NE BRESLOW, NE DAY und W. DAVIS. WHO IARC Scientific Publications No. 32. 338 Seiten. International Agency for Research on Cancer,Lyon 980. Preis: 50, sfrs; 30.00 US$. Food/Nahrung. 982;26(3):329. مجله علوم پزشکی زانکو/ دانشگاه علوم پزشکی کردستان/ زمستان 9-29 934/
شیوا منصوری هانیس 29 Original paper Downloaded from zanko.muk.ac.ir at 8:5 +0430 on Thursday August 23rd 208 Compare the estimated odds ratios from logistic regression and conditional logistic regression in the case-control study determination risk factors for unintentional childhood poisoning of children in Tehran Mansori K, Mansori Hanis SH 2*, Soori H, Khosravi Shadmani F 3, Moradpure F 4, Rajabi A 4, Gholami A 4 - Department of Epidemiology, Faculty of Public Health, Shahid Beheshti University of Medical Sciences, Tehran, Iran. 2- Student Research Committee, Kurdistan University of Medical Sciences, sanandaj, Iran; (Corresponding author). Email: mansorishiva@gmail.com 3- Department of Epidemiology, Faculty of Public Health, Kermanshah University of Medical Sciences, Kermanshah, Iran. 4- Department of Epidemiology, Faculty of Public Health,Iran University of Medical Sciences, Tehran, Iran. Abstract Background and Aim: Identifying risk factors affecting on incidence poisoning is a fundamental measure to prevent poisoning in the community, In the meantime, find an equation for determination effects of factors and severity association of them has great importance. Purpose of this study compare the performance of two models ordinary logistic regression and conditional logistic regression in determination risk factors for unintentional childhood poisoning. Materials and Methods: In the present study was used of data a case-control study that to determination risk factors for unintentional childhood poisoning in Tehran was carried out. After collecting the relevant data into the software stata and to determine the risk factors on incidence poisoning of two conditional logistic regression model and ordinary logistic regression was used. Odds ratios (OR) with confidence interval (CI) 95% for crude and adjusted with sensitivity, specificity, and area under the ROC curve were estimated for each of the proposed models, then they were compared. Results: In multiple conditional logistic regression model addiction in the family, previous poisoning, maternal occupation and inaccessibility of poisoning products have shown a significant impact on incidence of poisoning. But In multiple logistic regression model, addition to the items listed, mental -mental illness in the family showed a significant relationship with outcome (poisoning). The AUC of ROC for conditional logistic regression model %95.82 (CI: 95% 0.94-0.97) with sensitivity and specificity 92.9% and 84.2% respectively and for logistic regression model %89.75 (CI: 95% 0.86-0.93) with sensitivity and specificity 83.6% and 83.% respectively was obtained. Conclusion: Although confidence interval associated with conditional logistic regression model compared with logistic regression is narrow and on the other hand, higher under curve area of ROC is a good indication of the overall precision of this model in the diagnosis of poisoning. But should be noted that use of each of these models depends on the feature of data (matched or unmatched). Keywords: Childhood Poisoning, Case-Control, Conditional Logistic Regression, Logistic Regression